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38 要 : 森林 作为 陆地 最 大 碳 库 ,对 人 类 的 生活 与 发 展 至 关 重 要 ,精准 掌握 森林 资源 动态 变化 并 对 其 进行 现代 化 


可 持续 发 展 已 成 为 当下 研究 热点 。 本 文 以 天 山 山 脉 的 天 然 云 杉林 为 研究 对 象 , 利 


地面 实 测 数据 .直升机 机 载 激 


光 雷 达 点 云 数据 以 及 全 球 生 态 系统 动态 调查 激光 雷达 (Global Ecosystem Dynamics Investigation ,GEDI) BG ,构建 多 


源 融合 数据 框架 ,通过 使 / 
Height Percentile ,RH) 与 其 光斑 


] AutoKeras 框架 下 的 深度 学 习 算 法 ,实现 GEDI 数 据 的 多 个 相对 高 度 百 分 位 数 (Relative 
内 地 上 生物 量 的 回归 模型 预测 ,验证 GEDI 数 据 在 较 大 范围 的 地 上 生物 量 反 演 方面 


的 可 行 性 ,主要 结论 如 下 :(1) GEDI 数 据 用 于 森林 地 上 生物 量 估 测 研究 具有 较 高 可 行 性 ,通过 自动 化 深度 学 习 算 


法 ,训练 集 、 验 证 集 、 整 体 数 据 的 决定 系数 (Coefficient of Determination , £^) 4-3] 2j 0.69 ,0.63 


和 0.67 ,平均 绝对 误差 


(Mean Absolute Error, MAE ) 分 为 3.73 mg- hm ^,4.22 mg- hm ”和 3.89 mg- hm? ,具有 较 高 的 预测 精度 。(2) 直升机 激光 


多 模 态 数据 融合 ,定量 化 描述 研究 


雷达 作为 GCEDI 数 据 估算 地 上 生物 量 的 中 间 技 术 , 整 个 研 
区 单 木 基础 结构 参数 
力 ,也 为 相近 区 域 大 面积 的 森林 碳 源 汇 .生物 量 .蓄积 量 估 算 ,森林 管理 与 


供 理论 基础 ,具有 一 定 的 指导 意义 和 基础 数据 支撑 作 / 
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森林 生态 系统 是 全 球 生 态 环境 的 重要 组 成 部 
分 ,是 释放 和 吸收 二 氧化 碳 的 主要 碳 库 ,研究 表明 ， 
森林 是 陆地 生态 系统 中 最 大 的 有 机 碳 储 库 , 占 全 球 
总 植被 矶 储量 的 86%"。 因 此 ,准确 、 高 效 的 获得 森 
林 单 木 胸径 、 树 高 冠 幅 等 结构 因子 至 关 重 要 ,可 为 
生物 量 \ 碳 储量 求解 提供 数据 支撑 ,为 可 持续 森林 
管理 提供 科学 依据 。 传 统 的 人 工 野 外 森林 资源 普 
查 , 受 环境 限制 较 大 ,操作 复杂 数据 精度 容易 受 人 
为 主观 影响 无 法 满足 现代 林业 资源 调查 、 检 测 等 
活动 。 

激光 雷达 (Light Detection And Ranging, LIDAR ) 
作为 一 项 主动 遥感 技术 ,具有 数据 密度 大 分 辨 率 
高 GE TESR .数据 精度 高 . 受 天 气 影响 小 等 技术 优 
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的 同时 ,验证 GEDI 数 据 在 获取 森林 地 上 生物 量 方面 的 潜 


区 内 的 单 木 识别 准确 率 高 于 0.75。 最 终 本 次 研究 通过 


` 生 物 多 样 性 保护 等 多 个 项 目 研 究 提 
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势 ” ,可 以 无 接触 、 低 成 本 ,无 破坏 的 获得 森林 结构 
参数 和 林 下 地 形 信 息 。 各 类 型 激光 雷达 技术 相互 
补充 ,构建 多 源 数据 融合 框架 ,以便 精确 获得 树冠 
内 部 和 林 下 地 形 的 空间 特征 信息 ”, 为 估算 大 范围 
的 地 上 生物 量 (Above-Ground Biomass, AGB) , E fH 
量 等 提供 数据 支撑。 其 中 星 载 激 光 雷 达 主 要 以 卫 
星 为 搭载 平台 ,可 以 用 于 全 球 尺度 的 地 表 特 征 和 变 
化 检测 ,主要 应 用 于 全 球 测绘 地球 科学 、 大 气 探测 
等 活动 ”。2014 年 马里 兰 大 学 和 美国 航天 航空 局 
(National Aeronautics and Space Administration, 
NASA) 戈 达 德 太空 飞行 中 心 合作 ,建造 并 测试 了 全 
球 生 态 系 统 动态 调查 (Global Ecosystem Dynamics 
Investigation ,CEDI) 高 分 辩 率 激光 测 距 系统 ,并 于 
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2018 年 在 国际 空间 站 部 署 ” ,是 第 一 个 专门 设计 用 
于 获取 植被 结构 的 星 载 激 光 雷 达 系统 ” ,主要 应 用 


9 期 孙 丹 阳 等 :深度 学 习 方 法 下 GEDI 数 据 的 天 然 云 杉林 地 上 生物 量 反 演 1473 


层 高 度 。 朱 笑 笑 吧 发 现 GEDI 数 据 提 取 的 RH95 $E 
林 高 度 与 机 载 LiDAR 数据 提取 的 森林 高 度 相关 性 


于 南北 纬 51.6" 之 间 热 带 和 温带 地 区 的 森林 冠 层 高 
度 、 林 下 地 形 和 地 上 生物 量 等 精准 测量 ,致力 于 提 
高 气候 和 土地 利用 变化 对 生态 系统 结构 和 动态 影 
响 的 表征 能 

从 研究 方法 .技术 手段 方面 可 以 发 现 ,人 工 智 
能 和 多 来 源 、 多 时 间 .多 数量 的 林业 数据 使 用 频率 
日 益 增 加 ,传统 的 森林 资源 线性 回归 需要 满足 一 定 
的 条 件 假设 ,深度 学 习 已 成 为 机 器 学 习 和 人 工 智能 
的 一 种 突出 方法 岂 ,国内 外 学 者 在 深度 学 习 XE tO 
感 获取 森林 参数 方面 进行 广泛 研究 。Cao 等 总结 
生物 量 提取 方法 时 ,通过 多 元 线性 回归 、 神 经 网 络 
等 方法 构建 多 源 遥 感 参 数 与 生物 量 的 关系 ;Torre- 
Tojal 等 使 用 随机 森林 模型 估计 森林 生物 量 , 采 用 
2 折 交 又 验 证 获得 模型 拟 合 精度 让 高 于 0.7; Quiros 
等 ?i 选取 GEDI 的 RH100 作 为 林 分 垂直 结构 ,与 
LiDAR 比较 ,地 面 高 程 差 的 RMSE 为 6.13 m; Adam 
等 ?发现 GEDI 与 机 载 LiDAR 导出 的 数字 地 形 模型 


最 高 (R=0.95,RMSE=2.22) , 相 比 于 ICESat-2/AT- 
LAS,GEDI 提 取 的 森林 高 度 精度 更 高 。Ngo A7" Wu 
检验 了 RH 指标 从 90%~100% 的 性 能 ,验证 GEDI 数 
据 的 RH98 是 研究 CHM 的 一 个 很 好 的 性 能 指标 ， 
实 上 ,RH98 也 是 一 个 较为 常见 的 参数 选择 。 
根据 以 上 分 析 可 以 发 现 GEDI 中 RH 值 虽 然 作 
为 森林 高 度 代表 ,但 不 是 一 个 确定 的 测量 方法 ， 
此 对 于 GEDI 数 据 反 演 各 类 和 森林 参数 时 通常 选择 
RH95 或 是 单独 的 几 个 具有 代表 性 的 相对 高 度 百 分 
位 数 作为 反 演 GEDI 光 斑 内 的 森林 冠 层 高 度 的 重要 
BBC ,同时 可 以 发 现 构 建 多 源 数 据 融合 框架 ， 
快速 高 效 估算 生物 量 等 其 他 和 森林 功能 参数 成 为 必 
然 趋势 ,利用 其 他 影像 数据 提取 地 形 坡度 . 归 一 化 
植被 指数 等 因子 可 以 有 效 提高 模型 预测 精度 。 对 
于 GEDI 数 据 的 参数 使 用 方面 ,通常 使 用 有 限 个 RH 
值 作 为 GEDI 数 据 的 光斑 尺度 森林 高 度 值 , 例 如 ,使 
用 的 RH100 代 表 光 斑 内 的 最 高 树冠 顶层 ,这 种 方法 
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RA AAR PE (020.99) ,而 森林 冠 层 模型 之 间 则 显 
示 相 当 弱 的 线性 关系 (R=0.27) ; Fayad 等 中 则 对 林 
分 优势 高 度 采用 随机 森林 回归 建 模 方法 对 其 中 重 
要 性 变量 进行 排序 ,CEDI 的 RH70、RH80、RH90、 
RH100 占 前 四 ,可 以 发 现 GEDI 数 据 对 生态 系统 动 
态 监测 等 活动 具有 重要 指导 意义 ”” ,同时 国内 外 
学 者 对 于 GEDI 数 据 基础 参数 的 属性 设置 方面 也 进 
行 了 大 量 人 研究 与 探讨 。 

Fayad 等 "利用 GEDI 数 据 估算 瑞士 8 个 湖泊 的 
水 位 精度 ,虽然 与 现场 水 位 吻合 效果 较 好 ,但 是 处 
于 早晨 或 是 夜晚 采集 的 GEDI 数 据 要 比 白 天 或 是 周 
末 的 数据 具有 更 低 的 偏离 。Potapov 等 ”也 选择 了 
在 夜间 以 功率 激光 器 运行 收集 , 且 光 束 灵 敏 度 为 
90% 的 GEDI 数 据 , 同 时 对 地 面 高 程 的 范围 也 进行 设 
置 ,在 该 研究 中 ,除去 过 高 (>30m) 和 过 矮 ( <7 m) 
的 冠 层 高 度 值 ,GDEI 的 RH95 与 基于 Landsat 的 森林 
高 度 图 有 良好 的 对 照 关 系 。 林 晓 娟 “ 则 直接 使 用 
GEDI 的 光斑 高 程 ,选择 RH50、RH75、RH90、RH95、 
RH100 5j LZ; LIDAR 30 m 空间 分 辨 率 的 森林 冠 层 
高 度 机 格 产品 进行 比 对 ,选择 最 能 代表 森林 和 冠 层 高 
度 的 属性 字段 ,在 增加 CEDI 的 7 个 第 选 条 件 之 后 ， 
两 者 之 间 的 尼 明 显 增 大 ,各 类 误差 逐渐 减 小 ,最 终 
选择 RH95( 平 均 误 差 为 1.43 m) 代 表 CEDI 光 斑 的 冠 


虽然 便捷 高 效 ,但 忽略 了 光斑 内 的 植被 分 布 特征 ， 
未 考虑 所 有 RH 值 对 于 最 终 计算 的 区 域 性 森林 功能 
参数 的 影响 因素 ,存在 一 定 的 低估 现象 。 

因此 ,本文 结合 样 方 实测 单 木 数 据 、 机 载 Li- 
DAR 点 云 数据 .CEDI 数 据 , 构 建 多 模 态 数据 融合 ， 
以 GEDI 点 内 81 个 非 负 RH 值 (RH~RHo,1% 间 隔 ) 
为 输入 变量 ,AGB 为 输出 变量 , 尽 可 能 多 的 保留 CE- 
DI 光 斑 内 的 植被 分 布 特征 ,使 用 基于 AutoKeras 框 
架 的 深度 学 习 方 法 构建 AGB 回归 模型 ,减少 调 参与 
模型 构建 不力 的 同时 ,遍历 更 多 模型 ,提高 模型 预 
测 精 度 , 高 精度 的 实现 大 范围 的 地 上 生物 量 估算 ， 
验证 GEDI 在 实现 AGB 估算 方面 的 潜力 ,更 为 区 域 
FE AGB 估算 提供 方法 依据 和 技术 借鉴 。 


1 研究 区 概况 与 数据 处 理 


1.1 研究 区 概况 

研究 区 位 于 新 疆 巩 留 县 ,地 理 位 置 位 于 81°34'~ 
83°35’E ,42°54’~43°58'N( AI D ,隶属 于 伊犁 哈萨克 
自治 州 , 东 南 与 和 静 县 相 邻 ,主要 由 山地 、 丘 陵 、 平 
原 三 大 地 貌 单元 组 成 ,海拔 在 630~4230 m, 属 于 北 
温带 大 陆 性 半 干 旱 气 候 , 年 降水 量 270~280 mm ,年 
平均 气温 7.4%。 植 物 物种 约 3000 种 , 占 新 疆 野 生 
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Fig. 1 Sketch map of the study area 


植物 总 数 的 85% , 主要 树种 为 雪 岭 云 杉 (Picea sch- 
renkiana ) . #6 (Betula) , 424K (Sorbus pohuashanen- 
sis) 等 ,其 中 雪 岭 云 杉 作为 天 山 山地 最 主要 的 地 带 性 
森林 植被 ,是 构成 天 山 乃 至 新 疆 森 林 生 态 系统 的 物 
质 主体 下, 天 山林 区 内 90% 以 上 的 林地 均 有 雪 岭 
云 杉 生 长 。 本 人 研究 选择 天 然 雪 岭 云 杉 为 主要 研究 
对 象 ,使 用 直升机 载 激光 雷达 扫描 巩 留 县 林 区 内 面 
积 约 为 90 km 的 研究 区 域 ,同时 布设 30 个 实测 数据 
样 方 (25 mx25 m). 
1.2 技术 路 线 图 

研究 技术 路 线 主要 由 四 部 分 组 成 (图 2) ,第 一 
部 分 为 样 方 实测 获取 调查 ,获取 样 方 内 天 然 云 杉 的 
单 木 树 高 以 及 胸径 ,构建 其 回归 方程 ;第 二 部 分 为 
机 载 激 光 雷 达 获 取 的 点 云 数据 , 经 过 点 云 预 处 理 步 


又 后 ,进行 单 木 识别 ,获得 整个 研究 区 范围 内 的 单 
木 基础 结构 参数 ;第 三 部 分 为 GEDI 数 据 的 获取 .得 
选 以 及 与 机 载 数 据 释 加 构成 多 元 融合 数据 框架 , 同 
时 计算 CEDI 光 斑 内 的 地 上 生物 量 大 小 ;第 四 部 分 
主要 以 GEDI 81 个 非 负 RH 值 为 输入 的 特征 变量 ,对 
应 地 上 生物 量 为 输出 变量 ,使 用 深度 学 习 算 法 , 验 
证 GEDI 数 据 在 估算 地 上 生物 量 方面 的 可 行 性 。 

1.3 数据 收集 与 处 理 

1.3.1 样 方 实测 数据 在 研究 区 域内 ,根据 GEDI 光 
斑 位 置 分 布 .不 同 林 分 以 及 不 同 海拔 高 度 等 因素 ， 
以 天 然 云 杉林 为 研究 对 象 ,选取 30 个 (25 mx25 m) 
样 方 对 其 内 胸径 大 于 5 cm 的 天 然 云 杉 进行 每 木 检 
尺 。 此 外 ,30 个 样 方 均 使 用 PVC 管 测 强 进行 区 域 
划分 ,以 差分 GCPS 测 量 样 方 四 至 坐标 ,选择 东北 角 


样 方 实测 数据 


点 云 数据 预 处 理 


GEDI 数 据 


GEDIL2A 数 据 产 品 


波形 数据 提取 
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GEDI 闪 斑 内 的 生物 量 反 演 


图 2 技术 路 线 
Fig.2 Technology roadmap 


为 起 点 ,用 皮 尺 测量 被 测 树 到 任意 两 边界 线 的 交点 
VR ES ,记录 被 测 树 的 相对 坐标 ,同时 使 用 测 高 仪 和 
胸径 尺 获 得 被 测 树 的 树 高 .胸径 等 参数 。 最 终 30 个 
样 方 共 测 天 然 云 杉 单 木 686 棵 ,获取 其 树 高 .胸径 、 
相对 位 置 等 基础 信息 ,根据 样 方 内 单 木 树 高 .胸径 
分 布 情况 构建 非 线性 回归 关系 (图 3) ,最 终生 成 的 
拟 合 公式 可 供 胸 径 反 演 。 
1.3.2 机 载 激光 雷达 点 云 数据 

(1) 数据 收集 

飞行 前 ,将 实地 地 形 与 Google Earth 卫星 地 图 做 
详细 对 比 , 合 理 选择 飞行 区 域 ,确保 飞行 安全 。 采 
用 直升机 搭载 飞 思 IXU-RS 1000 航 摄 仪 .机 载 激 光 
雷达 (OPTECH Eclipse ) 扫 描 仪 及 GPS 辅助 航 摄 系 统 
进行 数据 采集 ,获得 研究 区 正 射 影像 图 和 点 云 数 
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据 , 飞 行 速度 为 4.8 m.s, 航 带宽 度 为 80~100 m, K 
行 器 选择 B-723U 直升机 ,航向 与 旁 向 重 受 率 分 别 
为 60% .30%。 需 注意 航 摄 结 束 后 飞机 安全 着 陆 , 航 
摄 组 立即 获取 影像 和 曝光 点 数据 并 检查 质量 , 须 补 摄 
或 重 摄 时 选择 合适 的 天 气 执行 航 摄 ,最 终生 成 *.las 文 
件 和 以 供 后 期 数据 检查 校准 的 影像 数据 。 

(2) 数据 处 理 

机 载 LiDAR 点 云 数据 的 处 理 主要 包括 前 期 点 
云 数据 预 处 理 阶 段 和 后 期 数字 产品 生成 与 分 析 两 
个 部 分 ,此 次 研究 使 用 LiDAR360 (http://www.li- 
dar360.com/) 软 件 实现 点 云 数据 的 拼接 、 滤 波 、 地 面 
点 分 类 、 单 木 分 割 等 工程 化 预 处 理 操 作 , 图 4 为 直 升 
机 机 载 激 光 雷 达 点 云 数据 处 理 流程 ,其 中 前 期 处 理 
后 的 点 云 数据 ,经 过 插值 方法 生成 基础 数字 地 形 产 


12r 
DBH-(0.0156935xH) 99 ë 
1.0 + R°=0.8252 ? o 
e 
E 08 上 
£f 
m 
A 06r 
XE 
Z oal 
0.2 - 
0 | 
60 
树 高 (HD)/m 
图 3 样 方 单 木 树 高 -胸径 回归 拟 合 
Fig.3 Regression fitting of H and DBH in the sample plot 
:点 云 数据 预 处 理 | 
| 基础 地 形 产品 CHM | DSM DEM 
| ht Y uad cC cL Lp apical dtc ibat cc Ea a dite | 
基于 CHM 的 单 木 分 割 
: 单 木 识别 精度 评价 | MENN EFEN 


:| 单 木 位 置 、 树 高 、 树 冠 面积 (csv)、 树 木 边界 (.shp) 


图 4 直升机 机 载 点 云 数 据 处 理 流程 


Fig.4 Flow chart of helicopter airborne point cloud data processing 
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品 ,包括 数字 高 程 模型 (Digital Elevation Model, 
DEM) 、 数 字 表 面 模型 (Digital Surface Mode, DSM) 与 
冠 层 高 度 模型 (Canopy Height Model,CHM )。 

针对 单 木 识别 问题 ,研究 选择 基于 CHM 的 单 木 
分 割 方法 ,其 本 质 是 针对 灰 度 图 像 做 分 割 处 理 , 最 
常用 的 算法 是 分 水 岭 分 割 , 即 在 生成 的 CHM 影像 中 
使 用 浸没 模拟 思想 (immersion simulation ) ,向 相 
邻 的 山 丘 或 高 低 分 割 开 来 ,从 局 部 最 小 值 注 入 流 
水 ,将 注入 区 域 注 满 ,根据 图 像 的 灰 度 变化 建立 屏 
障 作为 分 割 线 , 防 止 相 邻 区 域 注水 相遇 ,最 终 所 有 
区 域 均 注 满 且 无 相互 影响 从 而 形成 代表 单个 对 象 
存在 的 “ 集 水 盆 ” ,从 而 实现 对 单个 物体 的 识别 功 
能 。 图 5 为 研究 区 局 部 单 木 识别 效果 图 。 
1.3.3 GEDI 数 据 ”GEDI 共 由 一 个 全 和 窗 盖 激光 器 和 
两 个 全 功率 激光 咒 组 成 , 共 发 射 四 条 波束 ,每 个 光 
东 在 光路 上 进行 光学 拌 动 ,创建 8 个 地 面 轨 道 , 轨 道 
间距 约 为 600 m, 共 约 4.2 km 轨迹 总 宽 幅 ,每 条 轨道 
上 由 多 个 相距 60 m, 直径 约 为 25 m 的 圆 形 光 斑 组 
成 ,因此 , 沿 轨道 覆盖 几乎 连续 。 同 时 ,根据 数 
据 处 理 阶 段 的 不 同 ,GEDI 数 据 产 品 主要 分 为 4 个 等 
级 (https://gedi.umd.edu/)。 


图 5 基于 CHM 的 单 木 识别 
Fig. 5 Segmentation process based on CHM 


(1) GEDI 参 数 选 择 

本 研究 主要 选择 GEDI 的 1L2A 级 数据 产品 ,使 
用 数据 属性 为 相对 高 度 百 分 位 数 RH, 其 中 RH 的 获 
取 主 要 依靠 对 其 接收 到 的 波形 数据 的 分 析 与 处 理 ， 
取 值 范围 为 0~100,RHo 为 最 低 可 探测 回 波 ,确定 地 
面 位 置 ,RHio 则 为 最 高 可 探测 回 波 ,为 冠 层 顶部 , 表 
示 探 测 位 置 相 对 于 地 面 位 置 的 积累 能 量 的 100% 人 处 


的 高 度 。 但 并 非 所 有 波形 数据 均 能 满足 森林 资源 
调查 ,因此 在 数据 筛选 参数 中 设置 相应 条 件 ™. 

(D quality_flag=1 ,光斑 满足 基于 能 量 、 灵 敏 度 、 
振幅 和 实时 表面 跟踪 质量 的 标准 ,质量 良好 ,为 有 
效 波形 数据 。 

(2) sensitivity>0.95, 地 面 回 波 面 积 所 占 总 回 波 
面积 的 比例 与 1 的 差 值 大 于 0.90。 

(3) degrade. flag-0 ,数据 处 于 "降级 "时 ,形成 最 
佳 估计 ,数据 性 能 良好 。 

可 以 发 现 ,RH 主要 代表 对 应 探测 到 的 回 波 高 
度 与 光斑 内 平均 地 面 高 程 之 间 的 高 差 , 所 以 某 些 探 
测 到 的 高 度 会 低 于 平均 地 面 高 度 , 显 示 负 值 状态 ， 
因此 ,本 研究 使 用 的 GEDI 基 础 数据 为 非 负 RH 值 
(RH2~RHio, 间 隔 1% )。 

(2) 构建 多 源 融 合 数据 框架 

经 过 上 述 数据 筛选 , 共 从 8264 个 GEDI 光 斑 中 
选择 1082 个 GEDI 光 斑 用 于 本 次 研究 ,并 将 光斑 内 
的 所 有 单 木 AGB 累加 作为 CEDI 光 斑 的 实测 AGB, 
用 于 后 期 深度 学 习 算 法 建 模 。 其 中 人 研究 区 涉及 的 
GEDI 光 斑 ( 直 径 约 为 23m 的 蓝 色 圆 形 光 斑 ) 和 光斑 
内 的 单 木 分 布 状态 (绿色 波 点 ) 如 图 6 所 示 。 

机 载 激光 雷达 由 于 自 上 而 下 的 扫描 方式 ,难以 
获得 森林 冠 层 下 方 的 三 维 结构 信息 , 故 通过 30 个 样 
方 实测 数据 构建 树 高 .胸径 回归 方程 ,根据 机 载 Li- 
DAR 获得 的 单 木 树 高 求 得 其 胸径 Je SR RON PURI 
GEDI OGREN HY AGB 大 小 ,如 下 式 所 示 : 

AGB, =0.1661DBH*** (1) 


AGB= Ý AGB, (2) 
i=l 


14 深度 学 习 

深度 学 习 (Deep Learning, DLAME HHLA 3 KY 
ERR, RIERA (Machine Learning, 
ML) 在 数据 预 处 理 .算法 选择 以 及 调 参 困难 等 方面 
的 限制 。 本 研究 利用 Python 实现 基于 AutoKeras HE 
哥 的 次 度 学 习 方 法 ,选择 StructuredDataRegressor 模 
型 ,对 GEDI 的 81 个 非 负 RH 值 (RHw~RHiw) 与 光斑 
内 的 生物 量 构建 模型 来 预测 关系 。 
1.4.1 模型 反 演 对 于 选取 的 1082 个 光斑 数据 ,使 
FH Python 语句 实现 StructuredDataRegressor 模型 , pE 
机 选择 70% 作 为 训练 数据 集 (757 个 GEDI 认 斑 ) ， 
30% 为 验证 集 (325 个 GEDI 光 斑 ) , 共 遍 历 40 种 模 
型 ,分别 进行 300 麦 加 从 而 创建 新 的 特征 集 , 直 至 模 
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6 研究 区 点 云 单 木 识别 与 GEDI 数 据 分 布 
Fig. 6 Point cloud data individual tree recognition and GEDI data distribution in the study area 


型 到 达 预 期 效果 ,选择 平均 绝对 误差 (Mean Abso- 
lute Error, MAE ) 和 损失 函数 Loss 两 项 评价 指标 来 稀 
量 模型 预测 结果 ,MAE 和 Loss 随 着 迭代 次 数 的 增加 
而 变化 (图 7) ,同时 随 着 迭代 次 数 的 增加 ,MAE 和 
Loss 逐渐 降低 ,走势 逐渐 趋 至 平缓 ,生成 的 最 佳 模 型 
MAE 为 3.73 mg.hm? ,Loss 为 22.24。 


损失 函数 值 (Loss) 


深度 学 习 算 法 生成 的 模型 基础 参数 信息 如 表 1 
所 示 , None 是 指 将 所 有 数据 一 次 性 放 入 模型 进行 训 
练 , 其 后 数字 代表 一 维 数据 个 数 , 即 多 少 个 变量 
(CRH2~RHiw 的 81 个 特征 变量 ) ,激活 函数 主要 将 非 
线性 特征 引 和 模型 ,优点 在 于 计算 简单 .导数 简单 、 
收敛 较 快 ,其 次 模型 的 参数 个 数 ,等 于 上 层 神 经 元 


—— Loss 14 


平均 绝对 误差 (MAE) 


0 1 1 1 1 1 1 1 1 1 


1 17 33 49 65 81 97 113 129 145 161 177 193 209 225 241 257 273 289 


模型 迭代 次 数 


图 7 深度 学 习 模型 MAE 与 Loss 变化 曲线 
Fig.7 Curve chart of MAE and Loss changes in deep learning model 
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表 1 模型 结构 体系 
Tab.1 Model structure syst 


网 络 层 输出 大 小 参数 个 数 
输入 [(None,81)] 0 
多 类 别 编码 层 (None,81) 0 
归 一 化 层 (None,81) 163 
全 连接 层 (None,64) 5248 
激活 函数 1 (None,64) 0 
全 连接 层 (None, 1024) 66560 
激活 函数 2 (None, 1024) 0 
回归 层 (None, 1) 1025 


个 数 x 本 层 神经 元 个 数 , 再 加 本 层 神 经 元 个 数 。 其 
中 ,参数 总 数 为 72996, 参 加 训练 的 参数 个 数 为 
72833 ,未 参加 训练 的 参数 个 数 为 163。 

深度 学 习 模 型 对 训练 集 和 验证 集 的 预测 情况 
由 图 8 所 示 , 可 以 发 现 , 两 个 数据 集 的 预测 精度 均 有 
较 好 结果 ,AGCB 小 于 5 mg:hm” 的 数据 被 明显 高 佑 ， 


极 个 别 较 大 点 大 部 分 数据 预测 精度 较 高 ， 
误差 控制 在 [-3,3] 之 间 , 这 对 于 AGCB 主要 分 布 于 
[10, 30] a 影响 较 小 ,实际 与 预测 数据 之 
间 有 明显 的 回归 趋势 , 呈 较 好 的 对 应 关系 ,通过 数 
据 统 计 发 现 , 训 练 集 、 样 本 集 以 及 整体 数据 的 记分 
别 为 0.69、0.63 和 0.67,RMSE 分 别 为 4.68 mg hm”, 
5.31 mg.hm2 和 4.88 mg.hm2,MAE 分 别 为 3.73 mg- 
hm” 4.22 mg: hm “和 3.89 mg: hm 。 


2 结果 与 分 析 


2.1 单 木 识别 
根据 公式 (2) 可 知 ,GEDI 光 斑 地 上 生物 量 包括 
光斑 内 所 有 单 木 AGB 之 和 ,因此 在 进行 GEDI 数 据 
的 AGB 反 演 之 前 ,需要 对 机 载 激 光 雷 达 技 术 的 单 木 
识别 能 力 进 行 评价 。 此 处 选择 召回 率 (Recal,R) JE 
确 度 (Precision,P) 和 代表 分 割 整 体 精度 的 人 值 (F- 
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图 8 DL 预测 结果 图 


Fig. 8 DL prediction result graph 


score) ”为 评价 指标 ,如 公式 (3) ~ 公式 (5$) 所 示 ,其 
HH TP (True Positive ) 为 最 终 正确 提取 的 单 木 个 数 ， 
FP 为 错误 提取 的 单 木 个 数 (False Positive, FP) , FN 
为 未 被 提取 的 数量 (False Negative, FN)。 


_ TP 

R= TP + FN (3) 
_ TP 

P-TPIFP (4) 
_2xRxP 

F= Rap (5) 


结合 正 射影 像 图 ,在 整个 研究 区 随机 选择 3 个 
云 杉 密度 有 所 差异 的 样 地 (黄色 标点 ) 分 别 从 R .PN 下 
三 个 指标 进行 精度 评价 ,图 中 红色 标点 为 点 云 数 据 
经 处 理 后 的 单 木 识别 情况 (图 9) ,3 个 样 地 的 平均 召 
回 率 为 78.46% , 准确 度 为 88.16% , FEH 82.5% ( R 
2) ,对 比 发 现 ,树冠 之 间 高 程 起 伏 变 化 较 大 的 单 木 
正确 识别 率 较 高 ,高 程 变化 不 明显 的 单 木 会 出 现 过 
分 制 和 欠 分 割 情 况 ,说 明 机 载 LiDAR 对 单 木 识 别 具 
有 了 明显 可 行 性 ,可 以 准确 获取 树木 空间 坐标 及 各 项 
单 木 结构 参数 ,为 生物 量 、 碳 储量 的 估算 提供 可 靠 
Zi. 
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图 9 研究 区 单 木 分 割 局 部 示意 图 
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2.2 地 上 生物 量 误差 分 析 

采用 自动 化 深度 学 习 算 法 实现 GEDI 光 斑 与 多 
个 非 负 RH 之 间 的 回归 预测 ( 表 3) ,训练 集 验证 集 、 
整体 数据 集 的 决定 系数 尼 分 别 为 0.69 .0.63 和 0.67， 
均 大 于 0.6, 有 较 稳 定 的 预测 结果 ,RMSE(4.68 mg 
hm ,5.31 mg .hm ,4.88 mg:hm"7) FI MAE (3.73 mg: 
hm ?,4.22 mg.hm2 3.89 mg.hm-2) 数 值 较 小 ,形成 一 
种 较 稳 定 且 高 效 方法 ,同时 为 验证 该 方法 的 适用 
性 ,对 于 最 终 预测 得 到 的 光斑 AGB ,选择 反 距离 加 
权 插 值 法 (Inverse Distance Weight, IDW ) 绘 制 研究 
区 地 上 生物 量 分 布 图 (图 10)。 

可 以 发 现 ,经 插值 形成 栅 格 数据 后 ,研究 区 地 
上 生物 量 主要 分 布 于 7.25~39.58 mg hm?, AGB 的 最 
大 值 出 现在 研究 区 的 东北 部 区 域 ,其 次 为 西北 方 与 
南方 均 出 现 了 局 部 峰值 ,整个 研究 区 的 AGB 由 南 到 
北 呈 现 逐 渐 递 减 关系 ,这 主要 是 由 于 北方 地 区 为 草 
旬 草 原 ,AGB 分 布 均匀 ,上 且 明显 小 于 云 杉 林 的 AGB 
数值 大 小 。 结 合 数字 高 程 模型 ,发 现 单 木 生长 主要 
集中 于 海拔 1455~1900 m, Ji EE LE 99-26? ,2000 m if 
拔 以 上 的 区 域 单 木 数量 减 少 ,同时 AGCB 43-8 fi it , 
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Fig. 9 Partial display of individual tree segmentation effect in the study area 
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表 2 样 地 单 木 分 割 评价 指标 
Tab.2 Evaluation index for individual tree segmentation 


of sample land 


评价 指标 召回 率 (R)/% ”准确 度 (P)/% 下 值 /% 
样 地 1 67.40 93.93 78.48 
样 地 2 78.57 96.70 82.24 
样 地 3 89.40 84.29 86.77 
平均 值 78.46 88.16 82.50 


表 3 深度 学 习 下 AGB 的 预测 情况 指标 
Tab.3 Prediction indicators for AGB 


under deep learnin 


RMSE MAE 


模型 评价 指标 ” ”数据 集 R /gb /mg ham’) 
深度 学 习 (DL) ”训练 集 0.69 4.68 3.73 
验证 集 0.63 5.31 4.22 
总 体 数据 0.67 4.88 3.89 


具体 体现 在 研究 区 的 最 南部 和 最 东部 区 域 , 该 区 域 
也 位 于 整个 研究 区 的 主干 河流 位 置 ,在 同等 条 件 下 
人 为 活动 因素 对 其 影响 较 大 ,因此 会 出 现 局 部 地 区 
蜂 窜 状 峰 值 情况 。 由 此 可 见 , 本 次 研究 在 验证 GEDI 
数据 反 演 AGB 能 力 的 同时 ,为 区 域 性 乃至 更 大 范围 
的 地 上 生物 量 制图 提供 新 的 思路 与 方法 。 

分 析 整 个 数据 处 理 过 程 , 诸 多 因素 尚未 考虑 ， 
从 而 造成 最 终 佑 算 AGB 存在 误差 ,主要 包括 三 个 方 
面 :(1) 样 方 实测 数据 易 受 人 为 主观 影响 ,尤其 是 较 
高 单 木 的 树 高 测量 方面 ,同时 经 点 云 数 据 获 得 的 整 
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个 研究 区 单 木 参数 也 存在 一 定 误差 。(2) 整个 研究 
区 的 单 木 识别 普遍 存在 过 分 制 和 欠 分 割 现 象 。(3) 
点 云 数据 基于 CHM 进行 单 木 识别 ,通过 对 树冠 的 提 
取 确 定单 木 大 概 位 置 ,但 该 位 置 与 实际 情况 存在 一 
定 的 空间 不 匹配 情况 ,而 地 上 生物 量 主要 集中 在 校 
干部 分 ,树冠 伸 人 或 伸 出 样 方 范围 均 会 对 生物 量 计 
算 造 成 一 定 影响 ,未 考虑 边界 效应 。 

需 注 意 的 是 ,本 次 研究 使 用 CEDI 的 RHz~RHim 
作为 输入 变量 的 主要 原因 ,是 由 于 研究 区 的 某 些 地 
形 较为 陡峭 ,RH 大 都 为 负 值 ,为 统一 研究 基础 ,所 
以 研究 中 使 用 的 GEDI RH 值 均 为 正 值 。 该 做 法 使 
GEDI 数 据 在 输入 变量 个 数 方面 有 了 大 幅 提升 , 尽 可 
能 挖 气 了 RH 的 基础 属性 价值 ,对 于 地 形 平缓 地 区 ， 
RH 的 取 值 可 以 更 多 。 

最 后 ,多 源 数 据 融合 框架 模拟 生物 量 .蓄积 量 、 
材积 等 问题 越发 成 为 当下 研究 热点 ,GEDI ICESat- 
2 .Sentinel- 1 , Landsat 为 主要 应 用 星 载 数据 ,结合 其 
他 Lidar 技 术 ,形成 “天 -地 - 空 一 体 的 多 模 态 数据 
框架 ,该 方法 对 于 全 球 性 的 森林 资源 清查 .资源 可 
持续 管理 具有 一 定 的 指导 作用 和 技术 论证 ,同时 输 
和 人 变量 中 增加 高 光谱 影像 数据 ,结合 植被 指数 .地 
形 坡度 纹理 特征 、 降 水 等 数据 ,提高 回归 模型 的 拟 
合 精度 ,根据 大 量 研究 证 实 呈 "2 2 ,该 方法 存在 较 
大 可 行 性 。 
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AGB/(mg-hm’) mm 7.25-12.07 mm 12.07-14.98 国 14.98-18.15 mm 18.15~22.97 mm 22.97-39.58 


图 10 研究 区 地 上 生物 量 分 布 示意 图 
Fig. 10 Schematic diagram of AGB in the study area 
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3 结论 


本 文 以 新 疆 巩 留 县 林 区 为 研究 区 ,构建 多 源 数 
os 
数据 ,运用 深度 学 习 方 法 ,建立 GEDI 多 个 RH 值 与 
eee 的 预测 模型 ,最 终 以 实际 计算 地 
上 生物 量 数据 为 基础 ,验证 模型 拟 合 精度 ,得 出 如 
TZ 结论 : 

(1) 直升机 机 载 LiDAR 获取 大 范围 单 木 结构 参 
数 具 有 明显 优势 ,目前 已 经 形成 了 统一 的 作业 规 
范 , 研 究 区 平均 单 木 识别 率 可 达 75% 以 上 。 

(2) CEDI 光 斑 内 生物 量 与 81 个 非 负 的 相对 高 
程 百 分 位 数 RH 值 使 用 AutoKeras 框架 下 的 深度 学 
习 算 法 进行 模型 预测 ,训练 集 、 验 证 集 以 及 整体 数 
据 集 的 最 终 模 拟 精 度 均 在 0.6 以 上 ,对 最 终 输 出 变 
量 有 较 高 的 解释 程度 ,同时 自动 化 深度 学 习 实现 了 
模型 可 视 化 ,在 一 定 程度 上 减少 了 深度 学 习作 为 机 
器 学 习 “ 黑 合算 法 ”的 缺点 。 

目前 深度 学 习 方 法 在 林业 问题 调查 中 显示 出 
强大 潜力 ,可 以 结合 多 源 数据 完成 内 部 的 多 尺度 学 
习 , 且 无 需 显示 特征 的 提取 步骤 ,尤其 是 DL 的 非 线 
性 表达 ,可 以 高 精度 逼近 复杂 的 非 线性 映射 ,使 得 
最 终 输 出 模型 具有 强大 的 泛 化 能 力 。 总 之 ,多 源 数 
据 融 合 ,在 基础 数据 精度 得 以 保证 的 情况 下 ,深度 
学 习 方 法 可 以 实现 森林 地 上 生物 量 的 科学 计算 ,也 
为 森林 资源 调查 提供 一 种 思路 。 
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Study on using deep learning method to retrieve the biomass of natural Picea 
forest from GEDI data 
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Abstract: As the largest carbon reservoir on land, forests play a crucial role in human life and development. 
Understanding the dynamic changes in forest resources and modernizing their sustainable development is 
currently a significant research focus. This study focuses on natural Picea forests in the Tianshan Mountains and 
uses ground measurement data, helicopter airborne LiDAR point cloud data, and Global Ecosystem Dynamics 
Investigation (GEDI) data to construct a multisource fusion data framework. By utilizing deep learning 
algorithms within the AutoKeras framework, the study aims to predict the regression model of multiple relative 
height quantiles of GEDI data and their aboveground biomass in the study area, thereby validating the feasibility 
of GEDI data for large-scale aboveground biomass retrieval. The main conclusions are as follows: (1) GEDI data 
are highly feasible for estimating forest aboveground biomass. Through automated deep learning algorithms and 
training and verification sets, the overall data achieve a coefficient of determination (R’) of 0.69, 0.63, and 0.67, 
respectively, along with a mean absolute error of 3.73 mg: hm ^, 4.22 mg: hm ^, and 3.89 mg: hm ^, demonstrating 
high prediction accuracy. (2) Helicopter LiDAR, an intermediate technology for estimating aboveground biomass 
using GEDI data, exhibits a single tree recognition accuracy of over 0.75 across the study area. The study 
successfully utilizes multimodal data fusion to quantitatively describe the structural parameters of the single tree 
foundation in the study area while verifying the potential of GEDI data for obtaining forest aboveground biomass. 
Moreover, the study provides a theoretical basis for estimating carbon sources and sinks, biomass, stock, forest 
management, biodiversity protection, and other projects in similar areas, offering essential guidance, and 
fundamental data support. 

Keywords: natural Picea forest; GEDI; LiDAR; aboveground biomass; deep learning 


